El Concepto Fundamental - Cerebro y Manos
En nuestros laboratorios anteriores, vimos lo potentes que son los Modelos de Lenguaje Grandes (LLMs), pero también identificamos una debilidad importante: están atrapados en una caja. Solo conocen lo que fueron entrenados y no pueden interactuar con el mundo real.
Agentes de IA resuelven este problema combinando dos componentes distintos:
- El Cerebro: El modelo de lenguaje grande (como Qwen3-4B), que entiende el lenguaje humano, maneja la lógica y mantiene el contexto de la conversación.
- Las Manos: Código en Python y herramientas externas (APIs) que pueden interactuar activamente con el mundo real, como verificar el clima, navegar por internet o realizar cálculos.
Enseñar al Cerebro a Usar las Manos
Un modelo de lenguaje grande no puede naturalmente "hacer clic" en botones ni "ejecutar" Python. Hoy, nuestro objetivo es enseñar al Cerebro a reconocer cuándo necesita ayuda y formatear su salida para que nuestro programa en Python pueda ejecutar la herramienta para él.
